期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于中医方剂数据库的Top-Rank- k频繁模式挖掘算法
秦琦冰, 谭龙
计算机应用    2017, 37 (2): 329-334.   DOI: 10.11772/j.issn.1001-9081.2017.02.0329
摘要775)      PDF (854KB)(502)    收藏

为降低中医(TCM)方剂频繁模式挖掘过程中对经验参数的依赖,提高挖掘结果的准确性,针对中医方剂的数据特点,提出一种基于带权无向图的Top-Rank-k频繁模式挖掘算法。该算法可以直接挖掘出频繁k-itemset(k≥3)而无需产生1-itemset和2-itemset,并随之快速回溯到核心药物组合的频繁项集所对应的方剂信息;此外,采用一种动态位向量(DBV)的压缩机制对无向图中边的权重进行压缩存储,以有效地提高算法的空间存储效率。分别对中医方剂数据集、真实数据集(Chess、Pumsb和Retail)和合成数据集(T10I4D100K和Test2K50KD1)进行测试和比较,结果表明该算法与iNTK和BTK相比具有更高的时间和空间效率,而且也可以应用于其他类型的数据集。

参考文献 | 相关文章 | 多维度评价
2. 压缩数据上的关系代数操作算法
丁鑫哲, 张兆功, 李建中, 谭龙, 刘勇
计算机应用    2016, 36 (1): 21-26.   DOI: 10.11772/j.issn.1001-9081.2016.01.0021
摘要619)      PDF (923KB)(374)    收藏
针对在大数据管理中,在压缩的数据上无需解压即可进行相关操作的问题,在数据服从正态分布的前提下,根据列数据存储的特点,提出了一种新的面向列存储的压缩方法——CCA。首先,通过对列数据的长度进行归类;然后,采用抽样的方法获得重复度较高的前缀;最后,使用字典编码进行压缩,提出了列索引(CI)和列实体(CR)作为数据压缩结构来降低大数据存储的空间需求,从而直接有效地在压缩数据上支持选择、投影、连接等基本操作,并实现了基于CCA的数据库原型系统——D-DBMS。理论分析和在1 TB数据上的实验结果表明,该压缩算法能够显著提高大数据的存储效率和数据操作性能,与BAP和TIDC压缩方法相比,在压缩率分别提高了51%、14%;在执行速度上提高了47%、42%。
参考文献 | 相关文章 | 多维度评价
3. 基于搜索引擎优化的网络宣传机模型
谭龙江
计算机应用    2010, 30 (8): 2232-2234.  
摘要287)      PDF (506KB)(1096)    收藏
针对搜索引擎优化过程中的人工控制方式处理效率低下,可靠性差等问题,提出了自动实现网站信息优化的网络宣传机模型,给出了该模型的主要思想、关键算法以及运行流程。该模型采用反向爬虫技术收集收录排名等信息,并通过主题词叠加空间中的匹配操作,选择优化主题词;同时,网络宣传机采用蒙特卡罗算法实现匹配特征测度,提高了匹配效率与精度。仿真实验对比证明,该模型具有较好的搜索引擎排名提升能力和客户满意度。
相关文章 | 多维度评价
4. 领域相关自适应的PageRank算法搜索策略
潘昊 谭龙远
计算机应用   
摘要1660)      PDF (503KB)(963)    收藏
针对Web链接结构模型的特点,提出了一种新的基于领域相关可自适应的PageRank算法。实验结果表明,改进后的算法有效节约了CPU资源,缩短了计算时间,同时较好地解决了主题漂移现象。
相关文章 | 多维度评价